Обоснование кодификаторов системы. обработки данных о неисправностях
Перед решением другой ключевой задачи формирования информационного обеспечения — задачи определения объема кодификаторов рассмотрим области применения кодификаторов при сборе и анализе сведений о надежности. Действующие ГОСТы требуют, чтобы методы классификации и кодирования первичных данных о надежности обеспечивали представление информации из карточек учета неисправностей в виде кодов для перевода ее на машинные носители. Кодификаторы должны быть установлены в отраслевых нормативно — технических документах. Кодификаторы нужны — прежде всего в головной организации по обработке данных а неисправностях для ввода информации в ЭВМ в виде цифровых символов, соответствующих текстам описания характера и внешнего проявления неисправности. Кодификаторы используют также на всех эксплуатационных предприятиях, на которых внедрена система автоматизированной обработки информации.
Применение в карточке стандартных формулировок для внешнего проявления и характера неисправности (на рис. 4.3 в местах записи этих реквизитов предусмотрены специальные окна для заполнения их четырехзначными кодами) дало бы весьма ощутимые преимущества при подготовке информации к вводу в ЭВМ. Прежде всего стандартная формулировка обеспечит однозначность в понимании существа происшедшего отказа при анализе карточки десятками специалистов как эксплуатирующих подразделений гражданской авиация, так и заводов-поставщиков авиатехники. Такой эффект порождается отказом от слишком большого разнообразия словарных средств обычного языка, иногда являющихся причиной разночтений. Применение стандартных формулировок снизит трудозатраты на ввод данных в ЭВМ. Кодирование текстов описания неисправностей на эксплуатационном предприятии делает реальной передачу сведений о надежности авиатехники по каналам связи непосредственно в память ЭВМ без пересылки первичных сообщений или магнитных лент по почте.
Для реализации перспективного метода кодирования сведений о неисправностях на месте их обнаружения 228
в эксплуатационные предприятия направляются исчерпывающие, но не очень громоздкие кодификаторы системы «Надежность авиатехники». Однако окончательно’ перейти к цифровому кодированию всех данных в карточках учета неисправностей пока не удалось: во-первых, нежелательно возлагать дополнительную работу по кодированию на инженерно-технический состав, непосредственно занятый на технике, во-вторых, из-за неог — работанности достаточно подробных и не очень громозд-‘ ких кодификаторов.
Кодификаторы системы «Надежность авиатехники» должны содержать коды большинства реквизитов карточки учета. Исключение составляют реквизиты, заполняемые цифровой ‘информацией (например, наработка — или заводской номер). — Перечень реквизитов карточек и нормативно-технической документации, необходимой для кодирования, приведен в табл. 28. В настоящее время эксплуатационные предприятия гражданской авиации могут быть обеспечены несложными кодификаторами только первых четырех из названных в таблице — типов. — Объем — код-ификатарон для адреса інеіистфавноети’ (она называется кодификатором ключевых слов) весьма велик. В табл. 25 приведены данные об объеме соответствующих кодификаторов (в информационных си-стемнх на ЭВМ они называются словарями) по системам ЛА„
Табл и ц a 28 —
Организация-владелец |
Кодификатор- предприятий и: о. рга — низ аций гр ажданокой авиации |
Тип воздушного судна |
Кодификатор типов воздушных су,- |
(двигателя) |
дой Кодификатор типов двигателей |
Завод-изготовитель |
»- предприятий и орга.~ низаций гражданской авиации. |
Адрес неисправности (система, подсистема, агрегат, деталь) |
Кодификатор ключевых слов |
Внешние проявления |
Перечень наиболее употребитель* |
отказа |
ных формулировок внешних, щюяш* лений |
Характер, сущность отказа |
То же |
Наименование признака и ісоотіветствуїшцет-о реквизита в Карточке |
Нормативно-техническая документация, исшолвзуема-я. — при кодировании |
12 22 23 24 |
чіодсистемаїм, агрегатам, узлам и деталям. Всего в кодификаторе адресов неисправностей будет 9620 позиций. Конечно,, маловероятно внедрение работы с таким кодификатором в практику оформления первичных сообщений о неисправностях, если для инженерно-технического ■состава авиапредприятий эта операция будет обусловлена только необходимостью оформить карточку. ,
Однако при анализе любой неисправности инженерно-технический персонал гражданской авиации исполь — — зует технические описания. Если коды отказавших агрегатов и деталей будут проставлены в техническом описании, то перенести их после анализа существа неисправности в карточку учета не составляет большого ■труда. Поэтому цифровое кодирование адреса неисправности нетрудно реализовать для тех типов ЛА, по которым техническая документация имеет шифры разделов, .’подразделов и пунктов в соответствии с требованиями ■стандартов. Такая техническая документация уже поступает на авиапредприятия вместе с новой авиационной техникой. Шифр раздела в ней соответствует коду ■системы ЛА, подраздела — коду подсистемы, а пункта — коду в системе.
Создание классификаторов для внешнего проявления и характера неисправности представляет гораздо более сложную проблему, чем классификация других признаков в карточке учета. Здесь необходимо закодировать произвольный текст с непростыми понятиями. Опыт использования карточек учета при анализе надежности — авиатехники позволяет охарактеризовать лингвистические особенности текстов описания неисправностей.
Как .показали лингвистические исследования языка текстов описания неисправностей в карточках учета [15], все многообразие неисправностей авиатехники можно выразить всего 1200—1600 словами. Из 1200 слов словаря языка текстов описания Неисправностей высшая частотность первых 100 слов составляет 67 %, 200 слов — ®0 % и 500 слов — 93,3 %, т. е. с помощью 500 слов можно охарактеризовать неисправность авиатехники ^более чем в 90 % случаев.
Текст описаний состоит обычно из нераспростріанен — :ных предложений (например, трещина длиной 20 мм). В текстах существительные составляют 36 %, прилагательные и причастия — 26 °/о, глаголы — 16 %. Широко используются понятия, выраженные отдельными слова — 1230.
ми и именными словосочетаниями. Эти понятия означают различного рода объекты: гидравлический
насос, гидроусилитель, радиостанция УКВ. В именных ловосочетаниях главным еловом (основным носителем смысла) являются существительные, а остальные слова служат для уточнения главного слова. Например, разрушение лобового стекла.
Число слов в понятиях колеблется от одного до десяти, и в среднем равно четырем, число букв в понятиях ~20.
Таким образом, грамматическая структура языка; текста описания неисправностей авиатехники достаточно проста. Поэтому нет необходимости при созданиш специализированного информационно-поискового языкам описаний внешнего проявления и характера неисправностей разрабатывать систему кодирования понятий,, отношений и синтаксических правил.
. Проведенное исследование частоты встречи устойчивых словосочетаний q в текстах описания неисправностей показало, что из 2000 устойчивых словосочетаний,, выявленных в текстах карточек учета, высшая частотность первых 100 словосочетаний составляет 80 %, а 500» словосочетаний — 96,4 % (рис. 6.2). На остальные 1500 остается ~3,6 %. Этот результат позволяет надеяться, что информационно-поисковый язык будет несложен, так как частотные словари словосочетаний — основа для составления кодификаторов внешних проявлений и характера неисправностей.
Методика составления кодификаторов существенно определяется сферой его применения. Рассмотрим методику построения кодификатора описаний неисправностей для головной в отрасли организации по анализу надежности авиатехники. В дальнейшем охарактеризу— ем и методику построения кодификатора для использо-. вания в подразделениях гражданской авиации, непо-. средственно занятых эксплуатацией авиатехники.
Для оценки надежности авиатехники’ в головной ^организации отрасли выходные документы выдаются в виде, удобном любому пользователю. Никаких кодов в этих документах не используется, а все признаки неисправностей описываются обычным языком, т. е. автоматически декодируются. Операции автоматического декодирования зачастую (например, при получении сводных данных о неисправностях какого-то типа ЛА с ■сортировкой по техническому адресу и характеру. неисправности) занимает много машинного времени. Причина в том, что машинные кодификаторы (словари) не ^помещаются сразу в оперативное запоминающее устройство, а вызываются туда частями. Бели лее словарь полностью помещается в оперативной памяти, время. декодирования удается сократить на 20—30 %. Таким образом, при формировании кодификаторов, используемых в ЭВМ, необходимо максимизировать полноту машинного словаря при ограничении располагаемой памяти для его записи.
.Обозначим:
]-= 1, 2,…,/ — номера возможных формулировок. описания неисправностей в карточках учета;
■Pj — вероятность того, что формулировка с номером j понадобится для декодирования при ответе на запрос. ■Считается, что если в запросе формулировка понадобится несколько раз, то это приведет к нескольким обращениям в словарь. По статистике выполненных ответов на запросы в головной организации нетрудно посчитать. все Ру,
Cj — объем памяти, необходимый для размещения 7-й формулировки. По существу, это просто число букв — в формулировке с учетом пробелов (пример дан в тгабл. 29);
Xj=l, если /-я формулировка включена в кодификатор, и 0 — в остальных случаях;
P(J) —вероятность того, что понадобившаяся в произвольном запросе формулировка оказалась записанной ■в память ЭВМ.
Теперь задача назначения оптимального объема кодирования при записи на машинные носители описания неисправности формализуется как задача линейного щелочисленного программирования;
шайти такие х,, чтобы обеспечить максимум
j
2132
/ |
Ксщ |
Формулировка |
, s я е> It* !°” 81 !*§ к 3 Ёё |
. « 81 га я М ё о о га ё л <=> ч ЇҐ |
т |
СІ(М |
Не іработает (характер не установлен) |
ні |
14,410 |
■3 |
Щ|5 |
То же (изделие рекламировано или исследуется) |
w |
5,20 |
■I’ll |
ЮЮ|2 |
Отсутствует в. перечне Нарушение формы или размеров |
2(1 |
2,т |
т |
036 |
Износ, выработка (указать место) |
1,5 |
2,62 |
зо |
,3:82 |
Нагарообразование (указать место) |
27 |
0,96 |
40 |
606 |
Потертость, наклеп (указать место) |
17 |
0,54 |
27і |
81512 |
Усадка, усыхание, уплотнений. Нарушение свойств |
2!7. |
(1,20 |
20 |
1(6*8 |
Замыкание короткое (отличать 169) |
46 |
1,42 |
10 |
Г69 |
Замыкание межвитковое |
20 |
2,62 |
2 |
•2(70 |
Изменение параметров, (отличать 354, 4Ш) |
2ft |
9,ЗО- |
9 |
4100 |
Контакт отсутствует, подгорание |
30 |
2,83 |
ІЗ |
473 |
» не размыкается, залипа- ние |
32 |
1Д1 |
24 |
1594 |
Контакт перемещающийся |
22 |
1,01 |
18 |
■6313 |
Потеря упругости |
■ Кб |
• .1,62:’. |
ІЗ. |
‘6ЮЭ |
» свойств электро-изоляцией |
02 |
‘ 2,46 |
34 |
8155 |
Утечка (для. элементов РЭО) |
■ 6 |
0,7(3′.. |
21 |
4115 |
Негерметичность (указать место, отличать 404, 4117.) |
. (14 |
1,46. • |
31 |
4104 |
Негерметичность уплотнения |
• 26 |
1 0,96 |
36 |
4|16 я 1 |
» внутренняя (между полостями.) |
25 |
ода |
ЗЭ |
1350 |
Недостаточная производительность, мощность |
411 |
0,!777 |
2(5 |
354 |
Нестабильная работа схемы, элемента (отличать 2710) Нарушение целости |
34 |
1,27.’ |
32 |
292 |
‘ Коррозия, окисление (указать место) |
: 18- |
0,89′, |
35 |
(ISO |
Надиры, забоины.( указать место и размер)- |
•14 |
Д’66- |
6 |
ШІ5 |
Обрыв, (указать чего, отличать 531) |
5 |
4,00′ |
7 |
53(1 |
» провода. |
‘ 1,3 |
■ 3,Ю-“ |
37 |
5631 |
Отставание, отклейкш (указать чего) |
‘ 19 { |
058- |
/ |
Код |
Формулировка |
1 Необходимый объем памяти, байт |
. « к к я рЗ д О сг) Ь Л <=> ч та С5 ~ £г е^з |
ІІ7 |
бэа |
Перегорание, сгорание |
20 |
1,62 |
14. |
5S4 |
» электроламп |
212 |
2,08 |
.38 |
598 |
Повреждение, перетирание (указать чего) |
23 |
0,64 |
.26. |
607 |
Порыв, порез, растрескивание (изделий из неметаллов) |
2,0 |
1,23 , |
19 |
690 |
Разрушение (указать место, отличать 69:7, 698) |
40 |
1,58 |
38 |
697 |
Разрушение уплотнений |
21 |
1,13 |
6 |
698 |
» крепежа |
18 |
8,90 |
8 |
7810 |
Трещина (указать место и размер, отличать Sill) |
7 |
3,00 |
І6 |
81,1 |
Трещина крепежа Нарушение регулировки или взаимного положения |
45 |
1,81 |
33 |
‘163 |
Заедание, защемление, тугое движение |
32 |
1,39 |
29 |
чет |
Заклинивание, спекание |
21 |
■1,08 |
39 |
099 |
Разбалансировка, неуравновешенность |
за |
0,64 |
4 |
4ЮіЗ |
Разрегулировка (указать параметр) |
14 |
4,00 |
аїри условии
j
2 Сл-sSCp, (6.46)
Ї=1
где Ср — располагаемый объем памяти для записи словаря.
Чтобы как-то компенсировать заложенное в эту эпостановку задачи предположение об одинаковой важности всех J формулировок описаний неисправностей, наиболее важные (хотя и редко встречающиеся) формулировки типа «Пожар» или «Самовыключение двигателя» априори включаются в кодификатор.
Целочисленная задача (6.15), (6.16) хорошо решается с помощью стандартного пакета прикладных программ линейного программирования. При большом числе формулировок J ее точное решение мало отличается от приближенного (без ограничения на целочислен- ность). Приближенное решение задачи (6.15), (6.16)
очень легко получить. Для этого нужно расположить S34
Рис. 6.3. Вероятность описания характера неисправностей первыми формулировками в перечне (/) и формулировками классификатора (2) при располагаемом объеме памяти С. р
все формулировки в порядке убывания по критерию — «эффективность-стоимость», Т. е. ПО отношению Pj/Cj„. и включить в словарь первые М формулировок, суммарный объем памяти для которых не превышает Ср.
Оптимизация состава кодификатора путем формального решения задачи (6.15), (6.16) позволила сократить число формулировок описаний неисправностей в машинном словаре до 450—600 из первоначально применяемых 3000. При этом вероятность автоматического декодирования уменьшилась всего на 0,3 %. На рис. 6.3 (кривая 2) показаны результаты решения задачи (6.1’5), (6.16) при Ср=(2000—10 000 байт. При сокращении Ср на 20—■ 25 % примерно на столько же сокращается и число формулировок в машинном кодификаторе. Но при правильном отборе сокращенных формулировок вероятность. описания произвольной неисправности оставшимися, кодами уменьшается всего на 2—3 %. При автоматическом декодировании нельзя считать потерянными и эти. 2—3 % описаний, так как в случае, если соответствующей формулировки нет в словаре, ЭВМ выдает цифровой код, который можно исправить вручную.
Формальная постановка задачи обоснования содержания кодификаторов для эксплуатирующих подразделений несколько меняется. Ограничение типа (6.16) в ней есть, так как существует какой-то объем Ср перечня,- стандартных формулировок для описания неисправности, за пределами которого человек теряет интерес к. поиску в справочнике и придумывает формулировку сам. Но в (6.16) все Сj следует полагать равными между собой. Справочник, содержащий стандартные формулировки, печатается обычно так, чтобы любая формулировка — занимала в — нем одну строку; Получается, что^
объем справочника зависит только от числа формулировок М в нем, и именно это число выступает в качестве ограничения.
Решение задачи (6.15), (6.16) при таком ограничении получается просто отбором первых М формулировок в ранжированном ряду по убыванию Pj. В качестве. характеристики нужности /-й формулировки при обосновании классификатора для эксплуатирующих подразделений следует использовать Pj-вероятность применения J-й формулировки при описании неисправности, т. е. частоту использования соответствующих слов языка карточек учета. Пересмотрев все употребляемые формулировки, можно рекомендовать более информативный их набор, т. е. усовершенствовать кодификатор.
Практическая проверка позволила исключить из перечня малоинфор’мативные формулировки. В окончательной редакции осталось около 200 формулировок. Часть из них, описывающая характер неисправности, помещена в табл. 29. Последняя графа этой таблицы характеризует частотность применения формулировки, а первая — популярность ее в порядке убывания Pj. Первые 67 формулировок позволяют описать 97,3 % всех характеров неисправностей ‘(кривая 1). Сравнение кривых 1 и 2 соответственно на рис. 6.3 и 6.2 характеризует эффект работы по улучшению первоначальной редакции перечня. Сто формулировок в нем примерно эквивалентно 300, наиболее часто встречающимся словссочетани — •-ям в текстах описания неисправностей. Сравнение кривых 1 и 2 на рис. 6.3 показывает разницу в кодификаторах для обработки информации на ЭВМ и для описания. неисправностей в эксплуатирующих подразделениях. Кодификатор для работы в авиапредприятиях, конечно, гораздо проще. В нем формулировок столько, сколько можно разметить на двух страницах. Но около 3 % неисправностей с помощью этого кодификатора не описывается. Они неизбежно будут даны произвольным текстом в реквизите «Краткое описание характера (сущности) отказа» карточки учета, который необходимо дополнительно кодировать для ЭВМ. Машинный кодификатор. (словарь) характеров неисправностей содержит •450 формулировок, с помощью которых описывается :более 99 % всех неисправностей. Формулировки машиш того словаря не всегда совпадают с формулировками перечня. Многие описания неисправностей кодируются перед вводом в ЭВМ более подробно.
“23ІІ
1.
[1] (6′ — tj-)h,
6=1
где Ц — положителыные, убывающие по / коэффициенты, являющиеся обобщением сумм нормализованных интервалов, которые использованы нами ранее.
Завершим рассмотрение методоїв оценки параметров функции надежности по цензурированным выборкам. 1-4Q
[2] В этом и двух последующих параграфах использованы материалы — работ Е. П. Чувиляева, выполнявшихся — под руководством одного из авторов.
[3]